روشی کارا برای کاوش مجموعه اقلام پرتکرار در تحلیل داده‌های سبد خرید

Authors

Abstract:

Discovery of hidden and valuable knowledge from large data warehouses is an important research area and has attracted the attention of many researchers in recent years. Most of Association Rule Mining (ARM) algorithms start by searching for frequent itemsets by scanning the whole database repeatedly and enumerating the occurrences of each candidate itemset. In data mining problems, the size of data is often too large to fit in main memory. However, in some cases such as records of sales of a large supermarket, the probability of a particular item to be present in a transaction is often very low. This is due to the fact that a large number of items are usually available for purchase and also the fact that a small set of items is purchased by a customer in a shopping. In this paper, we make use of these facts to propose an efficient method for mining frequent itemsets. In our approach, the database is scanned just once, and data is encoded into a compressed form and held in a proper data structure in main memory. In each iteration, the time required to measure the frequency of itemsets, is reduced further (i.e., enumerating n-dimensional candidate itemsets is much faster than (n-1)-dimensional itemsets). We evaluate the efficiency of our technique using both synthetic and real-life datasets and compare it with other ARM methods proposed in past research

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

روشی کارا برای کاوش مجموعه اقلام پرتکرار در تحلیل داده های سبد خرید

کشف الگوهای پنهان و ارزشمند از درون حجم وسیعی از داده­های خام، اخیراً توجه بسیاری از محققان را به خود جلب کرده­است. اغلب روشهای کاوش قوانین تداعی در مرحله اول کار خود کلیه اقلام پرتکرار (ساده و ترکیبی) را از بین تمام اقلام موجود در داده­ها جستجو می­کنند که این امر نیازمند به خواندن مکرر کل داده­ها از دیسک است. در مسائل داده­کاوی، حجم پایگاه داده­های تراکنش معمولاً آنقدر زیاد است که قابل بار شدن د...

full text

رتبه‌بندی واحدهای کارا در تحلیل پوششی‌داده‌ها از طریق تضعیف واحد تحت بررسی در مجموعه امکان تولید

This paper presents a model for ranking efficient units by a new approach. In the proposed method, the idea of excluding the unit being scored from the production possibility set is changed to the idea of weakening the unit being scored. We propose a model for ranking efficient DMUs that is more efficient and less problematic than the models based on excluding the under evaluation unit.

full text

ارائه روشی کارا برای دسته‌بندی مسائل چنددسته‌ای با رویکرد انتخاب دسته‌بند

سیستمهای دسته‌بندی شورایی، رویکردی مؤثر در یادگیری ماشین است که در آن با ترکیب نتایج چند دسته‌بند سعی می‌شود تقریب بهتری از یک دسته‌بند بهینه فراهم شود. در حوزه ترکیب خروجی شورای دستهبندها، رویکرد «انتخاب دستهبند» توجه کمتری را در مقایسه با رویکرد «ادغام دسته‌بند» به خود جلب کرده است. همچنین، اغلب روشهای موجود در این حوزه، هزینه محاسباتی بالایی دارند. در این مقاله، روشی مؤثر در دسته بندی مسائل ...

full text

تحلیل گفتمانی؛ روشی برای تحلیل بازتاب انقلاب‌ها

انقلاب‌ها علاوه بر بعد ملی و سرزمینی دارای بازتاب‌های فراملی و جهانی هستند. نظریه‌پردازی در  مورد این بعد از انقلاب‌ها به‌طور عام و در مورد انقلاب اسلامی ایران به‌طور خاص کمتر مورد توجه بوده است. این مقاله با استفاده از نظریه تحلیل گفتمان لاکلائو وموف در پی توجه به این بعد بوده و در صدد است به این سؤال پاسخ دهد که از منظر تحلیل گفتمان لاکلائو وموف، قابلیت و نحوه بازتاب یافتن یک گفتمان انقلابی ه...

full text

روشی کارا برای پیش بینی ریزش مشتری

با توجه به اشباع شدن بازارها و افزایش رقابت کسب و کارها، امروزه هزینه ی جذب یک مشتری جدید به مراتب بیشتر از حفظ یک مشتری موجود است. بنابراین اهمیت مدیریت ریزش مشتری روز به روز برای کسب و کارها بیش تر می گردد. از طرفی با ظهور تکنولوژی داده کاوی و پیشرفت سریع آن، و همچنین با افزایش اطلاعات ذخیره شده در سازمان ها در ارتباط با مشتریان، کسب و کارها متمایل به استفاده از این تکنولوژی برای استخراج دانش...

15 صفحه اول

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


Journal title

volume 19  issue 7

pages  65- 74

publication date 2009-01

By following a journal you will be notified via email when a new issue of this journal is published.

Keywords

No Keywords

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023